Os modelos precisam de um parĂąmetro que controla a diversidade na metacomunidade e um que controla a dispersĂŁo. A relação entre os parĂąmetros de diversidade pode ser obtida a partir da igualdade proposta por por Vallade & Houchmandzadeh (2003) \(\theta = \frac{U (J_M - 1)}{1-U}\). Para isso aproximamos o nĂșmero de indivĂduos na metacomunidade como \(J_M = A_{landscape} * DA_{obs}*p\).
O parĂąmetro m Ă© a probabilidade de um evento de colonização na comunidade local ser por um propĂĄgulo da metacomunidade (Hubbel 2001). Podemos definir m como a mĂ©dia das probabilidades de cada sĂtio na comunidade local ser colonizada por um imigrante (eq 1; Chisholm & Lichstein 2009).
\[ eq 1: m = \frac{1}{A} \int \int_A m_{x,y} dxdy \]
Aproximamos as comunidades locais como åreas quadradas com lado L, que pode ser obtido por \(L = 100\sqrt{J/DA}\). Assim podemos reescrever a equação 1 como:
\[ eq 2.a : m = \left(\frac{1}{L} \int\limits_{-L/2}^{L/2} m_{x}(x)\mathrm{d}x \right)^2 \]
\[ eq 2.b :m_{x} = 1 - \int\limits_{-L/2}^{L/2} K(x-y) \mathrm{d}y \]
Onde K Ă© a função de dispersĂŁo. Na simulação coalescente a dispersĂŁo resulta do sorteio indepentende de duas distribuiçÔes de Laplace em eixos ortogonais centradas no sĂtio vago (figura X). Se consideramos a distribuição de Laplace como \(K(x) = \frac{\alpha}{2} e^{-|\alpha x|}\) (idem para o eixo y), entĂŁo:
\[eq3:m = (\frac{1-e^{-\alpha L}}{\alpha L})^2\]
Onde \(\alpha = 1/b\), b é o parùmetro escalar da distribuição de Laplace que pode ser escrito em função do desvio-padrão da distribuição de Laplace (d) \(b = d/ \sqrt{2}\). o desvio padrão corresponden à distùncia média de dispersão (Clark et al. 1999). Podemos reescrever a equação de m em funçao de d:
\[ eq4: m = d \frac{1 - e^{-\frac{\sqrt{2} L}{d}} }{\sqrt{2} L} \]
Com a equação 4 podemos calcular m a partir do desvio padrĂŁo da função de dispersĂŁo. Essa equação Ă© vĂĄlida para o processo de dispersĂŁo em paisagens homogĂȘneas. Na simulação coalescente, uma vez que sorteamos um progenitor e este estaria presente em uma unidade de nĂŁo habitat, o sorteio Ă© refeito atĂ© que o progenitor esteja em uma unidade de habitat. Uma aproximação do efeito da fragmentação no calculo de m pode ser obtido por:
\[eq.5: m' = \frac{mp}{1 - (1-p)m} \]
Onde p é a porcentagem de cobertura vegetal na paisagem. Caso seja necessårio calcular d a partir de m, utilizamos o ramo principal da função W de Lambert (\(W_{0}\)):
\[ eq6: d = \frac{\sqrt{2} L}{m W_{0}(- \frac{e^{-1/m}}{m} ) + 1} \]
Figura 1. Na primeira linha hĂĄ as variĂĄveis na escala padrĂŁo; na segunda linha as variĂĄveis apĂłs transformação Z (centra a mĂ©dia em zero e desloca a variação para o centro da distribuição REVISĂO). As linhas em vermelho equivalem ao quantil de 0.25%, 0.50% e 0.75% da amostra. S = riqueza observada; p = proporção de cobertura vegetal na paisagem
A proporção de cobertura vegetal variou de 0.0074 atĂ© 1, o quantil de 25% Ă© de 0.2916, a mĂ©dia Ă© 0.6727 e o quantil de 75% Ă© de 0.9216 (figura 1). A riqueza observada variou de 26 atĂ© 230, o quantil de 25% Ă© de 73.75, a mĂ©dia Ă© 105.85, e o quantil de 75% Ă© 134 (figura 1). HĂĄ um vies na amostra que apresenta mais trabalhos em paisagens com alta cobertura vegetal do que em baixas, por exemplo, o primeiro 1/4 da amostra estĂĄ entre 0.00 e 0.30, enquanto o Ășltimo 1/4 estĂĄ comprimido entre 0.92 e 1 (figura 1). A riqueza observada apresenta um outro padrĂŁo com uma tendĂȘncia central e uma assimetria para a esquerda [REVISAR]: 50% da amostra estĂĄ entre 73 e 134 com mĂ©dia e mediana prĂłximos de 100; o primeiro 1/4 da amostra estĂĄ entre 26 e 73 enquanto o Ășltimo 1/4 varia entre 134 e 230, o range do 1o quarto equivale Ă metade do range do Ășltimo quarto da amostra. HĂĄ certa covariação entre p e S: o Ășltimo quarto de p varia acima do quantil de 25%; enquanto o primeiro quarto de p varia atĂ© a mediana de S. PorĂ©m os 50% centrais de cada variĂĄvel estĂŁo representadas em todo o gradiente de variação da outra, e.g., entre o quantil de 25% e 75% de p observamos S que varia desde de valores inferiores Ă 50 atĂ© superiores Ă 200; e um padrĂŁo se observa para S. Para realizar a anĂĄlise estatĂstica aplicamos a transformaçaĂ” Z em p e S. A transformação Z centraliza no zero a mĂ©dia da distribuição e converte da escala da variĂĄvel para a de desvio-padrĂ”es; dessa forma torna-se mais direta a interpretação de modelos lineares generalizados hierarquicos (REF 2006). Essa transformação move a variação para a regiĂŁo central da distribuição mantendo a relação geral entre as observaçÔes (figura 1). NĂŁo hĂĄ motivos a priori para pensar que a predição dos modelos pode ser influĂȘnciada pela covariação entre p e S. [DĂVIDA] Paulo, lembro que discutimos sobre a relação entre teste frequentista e o efeito de S * p; me recordo de algo como que ao utilizar o p-valor estariamos de alguma forma ponderando isso [DĂVIDA].
Espera-se que quanto maior a estatĂstica D do teste de Kolmogorov-Smirnov menor o p-valor observado. NĂŁo esperamos observar relação entre p-valor, J e S. Segue avaliação destas espectativas
Figura 2. o p-valor obtido do teste KS (eixo y) e a maior distĂąncia entre os vetores de abundĂąncia (KS), tamanho da amostra (J) e riqueza observada (S).
O método parece estar adequado: i) KS.p e KS.D apresentam uma relação inversa; ii) não hå covariação entre KS.p com J e S.
Consideramos que um modelo neutro nĂŁo foi refutado quando o p-valor for maior ou igual Ă 5%. Contabilizamos o nĂșmero de prediçÔes nĂŁo refutadas (Goodness-of-fit) e modelamos a probabilidade de uma predição nĂŁo ser refutada usando um modelo logito. Agrupamos os dados pelo SĂtio de observação (Site). Ă possĂvel agrupar os dados considerando um intercepto por sĂtio (1|Site); 1 intercepto por modelo neutro (MN|Site); ou com 1 intercepto e 1 inclinação para k por modelo neutro (k*MN|Site). Na Ășltima opção k precisa ser interpretado como variĂĄvel contĂnua. Um protocolo de seleção de modelos hierarquicos pode ser encontrado em Zuur et al. 2009 onde se recomenda comparar formas alternativas de agrupar os dados a partir do modelo cheio da relação entre as preditoras. O modelo cheio proposto foi com a interação de terceiro grau entre as preditoras p, k e MN. Comparamos todas as combinaçÔes possĂveis por verossimilhança [DĂVIDA] se entendo corretamente, os parametros da estrutura aleatĂłria sĂŁo estimados pelo R2 e os estrutura fixa por algo similar Ă verossimilhança; entĂŁo precisa utilizar o parĂąmetro REML=TRUE [DĂVIDA]
Tabela 1 Qual o melhor modelo cheio?
O modelo estatĂstico com k como fator e agrupamento dos dados como MN|Site foi o Ășnico plausĂvel.
Tabela 2 Qual a relação entre as variĂĄveis Ă© mais plausĂvel?
O Ășnico modelo plaĂșsivel Ă© aquele que inclui a interação de terceiro grau. Vamos avaliar os resĂduos quantĂlicos utilizando o pacote DHARMa (REF). Se o modelo estatĂstico estĂĄ fazendo um ajuste adequado entĂŁo a distribuição dos resĂduos quantĂlicos deve ser prĂłximo a de uma distribuição normal (REF).
Figura 2. ResĂduos quantĂlicos do modelo mais plaĂșsivel [aquele que inclui p:k:MN], para detalhes ver documentação da função simulateResiduals.
A distribuição dos resĂduos quantĂlicos do modelo mais plausĂvel nĂŁo apresenta boa aderĂȘncia Ă uniformidade.